iT邦幫忙

2025 iThome 鐵人賽

DAY 2
1

在 「Notion 遇上 LLM:30 天打造我的 AI 知識管理系統」 系列裡,我的目標是把 Notion 從一個單純的筆記倉庫,進化為一個能理解內容、回答問題、甚至自動生成筆記的智慧助理。

昨天的 Day 1,我分享了自己的痛點:筆記雖然豐富,但搜尋不精準、跨頁整理費時、缺乏互動、內容更新仍要手動。今天,我要把腦中的構想落到具體的藍圖 —— 先定義系統架構、資料流,並說明有哪些功能,最後比較現有的解法(Notion AI、ChatGPT Connector)與我這個專案的差異。

/images/emoticon/emoticon30.gif

系統架構 (Architecture)

在Notion 遇上 LLM系列中,我們把系統分為三層:資料層 (Data Layer)、AI 模型層 (Model Layer)、應用層 (Application Layer)。

1. 資料層 (Data Layer)

  • Notion API:取得筆記內容,轉成程式可用的 JSON 格式。
  • 清理模組:移除雜訊、切片 (Chunking),並加上 Metadata(標題、分類、時間)。
  • 儲存:向量資料庫(例如 Chroma)用來存放嵌入向量,另外也能用 SQLite 或雲端備份保存原始資料。

2. 模型層 (Model Layer)

  • 嵌入模型 (Embedding Model):把文字轉成向量,支援語意檢索。
  • 語言模型 (Language Model, LLM):根據檢索到的片段生成答案,例如 GPT-4、Claude、Gemini。

3. 應用層 (Application Layer)

  • RAG Pipeline:把檢索與生成串起來,讓使用者的問題能對應到答案。
  • 介面 (UI):透過 Streamlit 提供問答互動。
  • 自動化 (Automation):定期同步新筆記,避免知識庫過時。

系統流程 (Data Flow)

  • 資料取得與清理:從 Notion API 讀取筆記,清理並切片。
  • 語意檢索與問答:將筆記向量化,存入向量庫;使用者提問後檢索相關片段,交由 LLM 生成答案。
  • 自動筆記生成與回寫:AI 能將摘要或待辦寫回 Notion,形成知識循環。
  • 互動與持續更新:透過 UI 問答,並透過排程自動同步,保持最新狀態。

為什麼不是用 Notion AI 或 ChatGPT Connector?

或許你會問:Notion 已經有 Notion AI 功能,甚至 ChatGPT Connectors 也能連接到 Notion ,為什麼還要自己做?下表就讓我們來比較三者差異,並說明為什麼本系列選擇使用自建 Rag 系統:

方案 Notion AI ChatGPT Connectors 自建 RAG 系統
適合誰 一般使用者 快速 Demo 技術實作、專案開發
優點 內建,能快速生成摘要或標籤 能跨頁查詢,免寫程式即可用 可控、可擴展,能支援「知識循環」
限制 跨頁檢索有限,無法自訂資料處理流程 無持久化索引,效率不高,寫回功能有限 需要開發與維護

換句話說,Notion AI 與 ChatGPT Connectors 適合日常或 Demo,但若要實現可控、可擴展、能持續演進的知識助理,就必須走向自建 RAG 系統。

小結與下篇預告

今天,我們定義了「Notion 遇上 LLM」的系統藍圖:

  • 架構分為資料層、模型層、應用層
  • 流程則涵蓋資料取得、檢索與生成、筆記回寫與自動化
  • 比較了 Notion AI、ChatGPT Connectors 與自建 Rag 的差異

在 Day 3,我們會正式開始 —— 認識 Notion API。你將看到 Notion API 能取得哪些資料、授權方式等,這是與 Notion 溝通的第一步,也是系統能夠運轉的基礎。


上一篇
【Day 1】系列開場 - Notion 遇上 LLM
下一篇
【Day 3】走進 Notion API:打開知識庫的大門
系列文
Notion遇上LLM:30天打造我的AI知識管理系統3
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言